郭老师统计小课堂 | 约翰·内尔德 (John Nelder)的故事
Editor's Note
郭老师统计小课堂向读者介绍和分享统计学的知识、趣事、方法和思想。希望能对统计学的传播起到一定积极作用,同时也希望更多的统计同仁一起分享更多的统计知识。让整个社会都感受统计学的魅力和力量。
The following article is from 郭老师统计小课堂 Author 陶雪然
本文由陶雪然同学完成。主要内容来源于英国皇家学会对约翰·内尔德的纪念文章。陶雪然同学对文章进行了删减、整理、补充和翻译。
约翰·阿什沃思·内尔德 (John Ashworth Nelder)(1924年10月8日—2010年8月7日)是一位英国统计学家,以其对实验设计、方差分析、计算统计和统计理论的贡献而闻名。他在一般平衡论、广义线性模型(GLM)、分层广义线性模型(HGLM)方面都有重要工作。特别是他在广义线性模型(GLM)方面的工作,彻底改变了统计建模的世界。此外,他与罗杰·米德(Roger Mead)一起开发的用于函数优化的单纯形算法非常受欢迎。
约翰于 1950 年在韦尔斯本的国家蔬菜研究站开始了他的职业生涯,之后从 1968 年直到 1984年退休,担任哈彭登的洛桑实验站的统计负责人。在那期间,他会定期在伦敦帝国理工学院讲授统计计算的课程。他写了几本非常有影响力的书并获得了许多荣誉,包括皇家统计学会的盖伊银牌和金牌和图卢兹的保罗萨巴蒂埃大学的荣誉博士学位。
早期生活
约翰·内尔德于1924年出生在英格兰西南部的萨默塞特郡,家境殷实。他的父亲是卡纳文阿姆斯酒店(就坐落在电影《唐顿庄园》取景地海克利尔城堡附近)的老板,但他无意接手家中已续传三代的酒店生意,自有一番志趣。他童年时期常常在巴尔勒山谷及其邻近森林探险,他毕生对观鸟的兴趣便始于童年时期对埃克斯穆尔乡村的探索。他自幼喜爱音乐,自五岁半时便学习钢琴,并曾在皇家音乐学院获得佳绩。
约翰年幼时由母亲教他读书,后来在私立小学读书。他天资聪颖,获得了知名的寄宿中学布伦德尔学校的奖学金,并在那里度过了他的中学时光。由于布伦德尔学校一直设立剑桥大学西德尼·苏塞克斯学院的奖学金,约翰年少时便笃志要到剑桥大学学习,并于 1942 年成功获得剑桥大学录取,在那里学习数学。
大学时光与战争年代
在战争时期的英国,剑桥大学的学生们都需要参加军事训练。所以内尔德每天下午都与空军中队一起度过,上午则是在剑桥大学上课,所学课程包括力学、电学和磁学、分析、矩阵代数和几何学,包括射影几何学。年底,他获得了剑桥大学数学优等生考试的第一名。
由于童年爱好的影响,大学时期的约翰依然活跃于各种兴趣社团中。他曾加入音乐社团学习演奏室内乐,加入鸟类俱乐部开始观鸟,还曾加入苏格兰乡村舞蹈社团。他也曾参加了数学协会的讲座,并回忆起曾听过数学家利特尔伍德的演讲。(这可能与利特尔伍德奇迹定律有关,该定律指出,平均而言,人类每月会经历一次百万分之一的事件。)
1943年,约翰加入英国皇家空军,并被派往南非接受驾驶员培训。他花了六个星期才到达南非的德班,在航行期间他减轻了20 磅的体重,后来据他回忆那是他唯一一次真正感到饥饿。1946 年,他结束服兵役,与许多退役军官一同返回剑桥完成他们的学业。
当时他的数学老师是亚伯兰·贝西科维奇教授,他喜欢使用苏格拉底式的教学方式讲课,即提出具有挑战性的论断,让学生依据已有的知识和经验各持观点,通过讨论、问答甚至辩论的方式来揭露对方认识中的矛盾,逐步引导学生最后自己得出结论,这使约翰受益良多。此外,贝西克维奇教授从不按照教材(Hardy 1952)进行教学, 而是更喜欢他自己著作中的例子,从而迫使学生们在业余时间阅读教材。不过,约翰也认为这并不是一件坏事。
约翰·内尔德于 1948 年在剑桥大学毕业,获得数学专业一等学位。毕业后,他想要寻找一份可以将数学应用到生物学的工作,最后选择了在统计学方向继续深造。
职业生涯
约翰作为统计学家的职业生涯可以分为三个时期,对应于他工作的地方:韦尔斯本、洛桑和伦敦帝国理工学院。与这三个时期相对应(大致)的是他的三大统计贡献:一般平衡、广义线性模型(GLM)和分层广义线性模型(HGLM)。
获得剑桥文凭后,约翰于 1950 年开始在韦尔斯本的国家蔬菜研究站工作。研究站的条件十分简陋,只能住在周遭满是泥泞的军用小屋里,至于研究设备,尽管那里有一台门罗电子计算机,但是没有电力供应。
所以,为了培训他胜任这项工作,约翰被派往哈彭登的农业研究机构洛桑实验站,该机构由约翰·贝内特·劳斯于 1843 年创立,在洛桑实验站,约翰结识了许多统计学家,并在此后的多年保持着密切的联系,包括George Dyke、Mike Grundy 和 Michael Healy。之后,他从洛桑实验站借调半年到凡尔赛的法国农业研究站。在那里,他学到了很多生物学知识,但由于法国人并不喜爱统计学,所以并没学到什么关于统计学的知识。在那之后他回到了洛桑实验站,并在韦尔斯本的研究条件齐备后返回了韦尔斯本国家蔬菜研究站,继续他统计学家的工作。
在韦尔斯本,约翰还在当地的一个鸟类学俱乐部结识了他的妻子玛丽,并于 1955 年结婚,于1956 和 1958 年诞下一子一女。
1968 年,约翰被任命为洛桑农业研究站的统计主管。费雪(Fisher)曾于1919年在这里建立统计学学科,当他离开那里去伦敦大学学院(UCL)任教时,他的副手兼合作者弗兰克·耶茨(Frank Yates)于1935年接替了他的职位,后者后来成为实验设计和统计计算领域的领军人物。耶茨曾是黄金海岸的一名调查员,对于线性代数的计算非常熟练,但从未正视过矩阵的价值。洛桑研究所的许多耶茨手下的工作人员不同意他的观点,他们一直在利用矩阵和向量空间的理论对统计学做出重要贡献。现在他们的阵营又来了一位新朋友,约翰·内尔德。
约翰在洛桑研究站有一个才华横溢的员工,是统计学家罗伯特·韦德伯恩 (Robert Wedderburn),他1947年出生于爱丁堡,曾就读于费蒂斯中学和剑桥大学。他和约翰一起开发了一个统一的建模框架,许多当时流行的统计模型都可以被视为该框架的特例,所以可以使用同一个通用算法进行拟合,并纳入同一个推理框架。他们将他们正在开拓的领域命名为“广义线性模型”。
一年一度的音乐日场开始了,每年夏天,约翰都会与牛津和剑桥音乐俱乐部的其他业余音乐家一起,在他位于雷德伯恩 (Redbourn) 的家坎伯兰小屋 (Cumberland Cottage) 以各种古典音乐节目来招待客人。在休息时间,玛丽会提供茶水和精选的精美蛋糕,如果天气允许,还会在美丽的花园中漫步。
约翰在洛桑的时期是他获得许多荣誉的时期。1977年,他被授予皇家统计学会盖伊银质奖章,1981年当选为英国皇家学会会员,同年被图卢兹保罗·萨巴蒂尔大学授予荣誉博士。他还曾担任国际生物统计学会主席。他于 1984 年从洛桑实验站提前退休,对此他后来解释说:
他们开始解雇60岁以上的员工,作为减少员工的一种方式。幸好我在那时离开了,因为不久之后,整个部门都从洛桑消失了。 这一切真的很令人伤心。 我必须说,我幸好没有卷入那种活动。
此外,在洛桑实验站期间,约翰开始在帝国理工学院授课,并被任命为客座教授。这种联系促成了他与彼得·麦卡拉(Peter McCullagh)的重要合作。他们 1983 年出版的《Generalized linear models》一书将约翰之前对于广义线性模型的工作加以扩展和建立,被视为统计经典。
统计计算
约翰在统计计算方面功不可没。其一,他既对算法设计有兴趣,还对涉及计算机本身的算法实现有天赋。例如,在 1961 年,他描述了一种用于拟合广义四参数 logistic 曲线的算法,并简要考虑了五参数情况的扩展,发现除非可以使用计算机,否则五参数情形的拟合将耗费太大精力。他1963 年的另一篇论文描述了将 Yates 的全因子实验算法扩展到分数实验。其二,他坚定地提出了开发统计软件包的指导性原则:软件包应不仅能够解决开发人员预设的一些标准问题,还应该提供给用户足够的灵活性,使用超出开发人员预设的功能。其三,他在开发两个重要的统计软件包 Genstat® 和 GLIM® 方面发挥了重要作用。
约翰始终认为,程序可以帮助建模者以有原则和合乎逻辑的方式表达他们的创造力,让他们专注于重要的事情,而不是被固有的预测模板所规定他们可以做什么。 毫无疑问,这直接或间接地对 R语言的开发产生了极大的影响。
广义线性模型(GLM)
约翰在描述GLM 的起源时曾说:
“我注意到Probit模型的算法和我为空间统计实验引入的伽玛误差型模型的算法有一定的相似性。我只是说这些东西很相似,但我认为这就是最初想法的来源,即有一组模型有一个共同拟合算法。我认为这也启发了韦德伯恩随后对指数族的提出和我们后续的论文。”
约翰·内尔德和他的合作伙伴韦德伯恩共同建立了“广义线性模型”的概念。他们考虑了一类具有以下三个特征的模型:
首先,因变量z具有依赖于某些参数 θ 的指数族概率分布。
其次,线性预测器,其中的预测值Y可能与z相关。
第三.一个所谓的连结函数,θ=g(Y)。它通过预测值Y将线性预测器连接到z的参数θ。(请注意,在这个公式中,Y不是随机变量,而是它的期望。)
他们展示了如何使用最大化似然的一般拟合标准,可以使用相同的通用算法获得此类模型参数的估计值,即迭代加权最小二乘法。他们还提出了一个统计量,即偏差,可用于比较模型,在最大值时减去log似然的两倍,从而将方差分析推广为到 GLM 类的成员。
韦德伯恩不幸的早逝中断了这种伙伴关系。然而,约翰很幸运,他在帝国理工学院的兼职工作让他接触到了另一位统计人才彼得·麦卡拉 (Peter McCullagh)。他们当时的部门负责人David Cox建议他们为 “Chapman and Hall 统计和应用概率专著系列” 写一本书。正是因此,他们合著了“Generalized linear models”,在后来被广泛认为是对广义线性模型这一主题进行了明确说明的经典著作,涵盖了基本理论,并扩展了均值和离差建模、非线性参数、模型检查和生存分析,还包括许多其他相关主题的说明,例如韦德伯恩的拟似然概念。它还提供了许多实用示例,其中包含有关模型拟合的有用建议和说明。在第二版出版 30 年后,它仍然每年销售约 400 册。除了被引用,它还在 2013 年成为卡尔·皮尔逊奖的首届获奖者,以下是颁奖词:
“Generalized linear models” 永远改变了统计学的教学、研究和实践。它为分析连续、二进制、计数、分类、生存和其他类型的数据提供了线性模型的统一和独立处理,并说明了来自不同领域的应用程序的方法。该专著基于多篇开创性论文,包括“广义线性模型”,“拟似然函数、广义线性模型和高斯-牛顿法”,以及“序数数据的回归模型”。
分层广义线性模型(HGLM)
约翰的这一项重要贡献是一次愉快的合作的结果,堪比于数学家 G.H Hardy和J.E Littlewood的天作之合。从 1989 年到约翰 2010 年去世,合作关系持续了 20 多年,涵盖了 21 篇出版物。
约翰·内尔德和 Youngjo Lee 在皇家学会的一次会议上,1995 年 6 月 21 日
约翰在介绍 HGLM 方面的工作时,经常提到线性模型的基本理论的两个扩展方向。一个方向是分层方法,误差项可以在不同级别输入。另一个方向是选择一个误差分布。然而,这留下了一个明显的挑战,那就是找到一个方法使得随机项分层数据中非正态。他与 Lee 的 HGLM 理论就是为了回答这个问题而开发的。
在许多统计方法中,由于各种原因,将所有不可观测值都视为固定但不方便得知的,且它们可能非常多,因此参数空间的维数会增加,这不是我们愿意看到的。一种解决方案是将它们视为来自公共分布的随机实现。因此,许多单独的参数被一些通用参数所取代。
这种随机量通常称为随机效应。统计学家之间尚未就如何处理它们达成一致;一种常见的方法是将它们整合起来形成边缘似然,它的问题是不提供随机效应的估计。Nelder 和 Lee 使用的完全基于似然的方法是采用 Bjørnstad 大约在同一时间称为扩展似然原理的方法(Bjørnstad 1996)。他们使用联合似然,将随机效应分解为 (i) 随机效应的边缘似然和 (ii) 固定效应和随机效应的条件似然基于给定随机效应的结果的条件概率。他们称这个为H-似然。
统计之外的兴趣
约翰不仅仅是一名统计学家。音乐和观鸟是他在统计之外最重要的两个兴趣。园艺也是他的爱好,尽管他们在雷德伯恩坎伯兰小屋的精美花园中的大部分工作都是由妻子玛丽完成的。
他对统计的兴趣似乎延伸到了他的爱好中。他的女儿罗斯曾偶然发现一个写得工整的活页文件夹里面有五十年代末六十年代初的花园笔记,在那段时间里,他正在对农作物进行试验,并记录成功、失败,以及造成的农作物损害的原因是真菌还是昆虫。他的儿子简回忆说,从 1962 年到 1965 年,每个星期天早上他们都会去韦斯布尔附近的公园数鸭子,可能是为了给英国鸟类学信托基金收集数据。出于对鸟类的喜爱,在他曾经发表的一篇文章里,他使用统计的方法对 1890 年至 1930 年期间在苏塞克斯黑斯廷斯附近目击到稀有鸟类的一些说法提出了质疑。简还描述了他曾制定了一个计划,观察飞行展结束后返回的汽车经过他家门前的数量,以计算有多少驾驶员系好安全带,这既关乎安全,也是统计学的生动实践。
他的整个家庭都被他对古典音乐的热爱深深影响着。简回忆起年少时经常被父亲带着听室内乐音乐会。以及曾经被父亲要求录下雷德伯恩的年度特色音乐会。约翰感到这些高标准现场业余表演是非常令人愉快的,无论之后是否有人去听,都应当留下这样一份珍贵的资料。
在她的葬礼悼词中,他的女儿罗斯写道:
约翰喜欢带领他的孙辈们去探索更深刻的数学或文字的谜题,他永远期盼着年轻一代去拓宽他们的思维和视野!
直到他漫长而活跃的生命的最后一刻,他一直对国家和国际事务保有热情,并且经常给相关机构写信,去提出他认为好的想法,或是建设性、批评性的意见。
总的来说,我的记忆中他是一个永远活跃、求知欲强、兴趣广泛、记忆力极好、追求精准、从不妄言的人……他能一直保持这样的清醒直到他生命的最后一刻,真是太好了。我至今十分怀念我们的每一次交谈。
参考文献
[1] Senn Stephen 2019 John Ashworth Nelder. 8 October 1924—7 August 2010 Biogr. Mems Fell. R. Soc.67 307–326 http://doi.org/10.1098/rsbm.2019.0013